Статью команды Sber-AI приняли на ведущую конференцию NAACL 2025 🎉 Исследователи из
Сбера и
AIRI представили
RusCode — первый
бенчмарк, оценивающий способность генеративных моделей подстроиться под российский культурный код в задачах
text-to-image. Модель должна не просто рисовать «суп», а уметь отличить борщ от окрошки, узнавать Лермонтова по фуражке, а Пушкина по бакенбардам.
Что внутри:🔘 1250 сложных текстовых описаний культурных объектов на русском и английском
🔘 19 категорий: от литературы и фольклора до мемов, автомобилей и научных открытий
🔘 Эталонные изображения для каждого промпта
🔘 Сравнительная оценка качества генерации у DALL·E 3, Stable Diffusion 3, Kandinsky 3.1, YandexART 2 от 48 независимых экспертов
📊 Вывод: большинство западных моделей «не считывают» российский визуальный код. Только модели, дообученные на русскоязычных данных, уверенно справляются.
🌏 Авторы поднимают важный вопрос: чтобы модели были по-настоящему универсальными, им нужно «понимать» культурный контекст запроса, а не только рисовать красиво. Благодаря появлению
RusCode пользователи со всего мира смогут создавать более аутентичный контент в российском стиле.
Подробности по ссылкам:🔗 ArXiv🔗 GitHub